Was ist eine gute Grafik?

Excellence in statistical graphics consists of complex ideas communicated with clarity, precision, and efficiency. (tufte2001visualizing?)

  • show the data
  • induce the viewer to think about the substance rather than about methodology, graphic design, the technology of graphic production, or something else
  • avoid distorting what the data have to say
  • present many numbers in a small space
  • make large datasets coherent
  • encourage the eye to compare different pieces of data
  • Reveal the data at several levels of detail, from a broad overview to the fine structure
  • serve a reasonably clear purpose: description, exploration, tabulation, or decoration
  • be closely integrated with the statistical and verbal descriptions of a data set

Darstellung von David McCandless in Knowledge is Beautiful (2014).

Übung: What makes a bad plot?

Jede Gruppe bekommt eine Abbildung.

  1. Diskutiert in der Gruppe, was bei der Visualisierung schief läuft.
  2. Session
  3. Kurze Diskussion. Stellt den anderen Gruppen eure Ergebnisse vor.

Bild gefunden auf Reddit.

Gliederung?

Informationen

  • Integrität der Datenquelle
  • Integrität der Darstellung

Fehlender Kontext

Election Plot

https://storymaps.arcgis.com/stories/0e636a652d44484b9457f953994b212b

Land doesn’t vote, people do

Alternativen

Dafür die Plots selber nachbauen?

Achsen

Konventionen

Verdrehte y-Achse

776.013 Home protection; use or threatened use of deadly force; presumption of fear of death or great bodily harm.— (1) A person who is in a dwelling or residence in which the person has a right to be has no duty to retreat and has the right to stand his or her ground and use or threaten to use:
(a) Nondeadly force against another when and to the extent that the person reasonably believes that such conduct is necessary to defend himself or herself or another against the other’s imminent use of unlawful force; or
(b) Deadly force if he or she reasonably believes that using or threatening to use such force is necessary to prevent imminent death or great bodily harm to himself or herself or another or to prevent the imminent commission of a forcible felony.

http://www.leg.state.fl.us/statutes/index.cfm?App_mode=Display_Statute&URL=0700-0799/0776/Sections/0776.013.html

Sollte die y-Achse immer bei 0 beginnen?

“The designer of the visualization, by selecting a y-axis starting point, has control over the subjective importance of the resulting differences.” (Correll et al., 2020)

::: images-ref Grafik aus Huff (1979), heruntergeladen von Observable blog. :::

Absolute Werte

in der Regel ja

Veränderung der Werte

Ermessensfrage:

“If zero is in the neighborhood, invite it in!”Andrew Gelman

Test2

Manipulation des Bildformats

set.seed(42)
my_weight <- data.frame(
  month = factor(c("Januar", "Februar", "März", "April", "Mai", "Juni", "Juli", "August", "September", "Oktober", "November", "Dezember"),
    levels = c("Januar", "Februar", "März", "April", "Mai", "Juni", "Juli", "August", "September", "Oktober", "November", "Dezember"),
    ordered = TRUE
  ),
  weight = rnorm(12, 90, 5) / 1000,
  group = rep(1, 12)
)

ggplot(
  my_weight,
  aes(x = month, y = weight, group = group)
) +
  geom_point() +
  geom_line() +
  labs(
    title = "Mein Gewicht 2024",
    subtitle = "In metrischen Tonnen",
    x = "Monat",
    y = "Gewicht in t"
  ) +
  ylim(0, 1000) +
  theme_bg() +
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1))

Story

Rolfs 7 Nature

Goal

  • Usefulness
  • usable
  • fitting
  • efficient

Tufte Zitat

Effizienz: Salienz von Informationen

https://www.nature.com/articles/nmeth1010-773 Unterscheiden von Gruppen: - Gruppierung - Größe - Farbe - Form

  • Bewusste Wahrnehmung ignoriert Informationen und fügt hinzu
  • Nähe
  • Salienz (Farbe, Größe, Neigung) (Szafir, Haroz, Gleicher & Franconeri (2016))
  • Hier würde das USA Bild passen (evtl. mit einem anderen Beispiel, das den Unterschied deutlich macht, z.B. keine andere Farbe, näher dran durch andere Achse)
  • Harold et al., 2016: Lenken von Aufmerksamkeit
  • Nothelfer et al., 2017: Redundatne Kodierung führt zu deutlich höherer Genauigkeit der Antworten und kürzeren Reaktionszeiten

Darstellung von Größen

Die Größe von Kreisen einzuschätzen ist schwer!

Das gleiche gilt für Winkel!

Versuche, die Größen zu sortieren:

Farben

Foto von Efe Kurnaz auf Unsplash

Farbwahrnehmung beim Menschen

Primärfarben des Lichts: Rot, Grün, Blau

Trichromatizität

Der Mensch hat in der Regel drei Zapfentypen, die unterschiedlich sensitiv für bestimmte Wellenlängen sind:

  • RGB erklären (und die Addition im Gehirn?

By BenRG - Own work, Public Domain, Link

Andere Tiere können auch mal mehr oder weniger haben:

Viele Tiere sehen nur grau:

  • Wale
  • Haie
  • Waschbären
  • Faultiere
  • Armadillos
  • Oktopusse
  • Kraken

Warum also überhaupt Farbwahrnehmung?

  • Ist subjektiv
  • Aber kann konsistent wahrgenommen werden: Eine Erdebeere im Schatten und im Sonnenlicht kann jeweils rot wahrgenommen werden. Grautöne sind stärker vom Licht abhängig.
  • More is not always better: Affen vom Amerikanischen Kontinent sind teilweise die und teilweise tetra: di kann besser INsekten ausmachen, tri Früchte gegen grünen background.
  • Farbwahrnehmung also abhängig vom Drumrum
  • Farben bringen nur einen Vorteil, wenn ein Individuum daraus meaning ableiten kann.

Farben

Ganglienzellen übertragen keine Informationen über absolute Helligkeit, sondern über relative Helligkeit. ‣ Wie stark unterscheiden sich zwei Bereiche in ihrer Helligkeit? ‣ Wie stark hat sich eine Helligkeit gerade geändert? Allgemeine Lehre daraus: ‣ Visualisierung kann nicht gut darin sein, absolute Werte zu kommunizieren (Tabellen können das besser) ‣ Hingegen ist das visuelle System (und das Gehirn allgemein) extrem gut darin, Unterschiede und Veränderungen zu erkennen –> Beispiel bringen (Simultankontrast)

  • Graustufen nicht für absolute oder kategorische Werte nutzen (mehr als vier können iwr nicht gut unterscheiden)

Farbton, Sättigung, Helligkeit

Kleine Farblehre

“All colors are the friends of their neighbors and the lovers of their opposites.” - Marc Chagall

Nach MalteAhrens at de.wikipedia. Vectorization by User:SidShakal - Raster version from Wikimedia Commons., Gemeinfrei, Link

Kleine Farbenlehre

Vincent van Gogh, Public domain, via Wikimedia Commons

  • Gegenüberliegende Farben intensivieren sich gegenseitig: eine Primärfarbe, und eine Sekundärfarbe, die aus den anderen beiden Primärfarben gemischt wird. Das erzeugt stärkere Kontraste. (Van Gogh bild)
  • Mit weiß und schwarz lassen sich die Schattierungen hinzumischen
  • triadisches Farbschema: Fom MIttelpunkt des Farbkreises Strahlen mit gleichem Winkel abgehen lassen (So viele, wie man Farben haben will). Das wählt dann Farben mit dem größten Kontrast aus. (https://www.kunstplaza.de/fashion-design/farbenlehre-farbtheorie-styleguides-fashion-design/)

Farbräume

  • RGB: Zusammenmischen von Licht der unterschiedlichen Farben. Alle drei zusammen ergeben weiß.
  • CMYK: Ausblenden aus dem weißen Farbspektrum durch Filter. Grundfarben: Gelb, Magenta (Purpur), Cyan (Blaugrün) (+K - Key (also Schwarz))

Was bringt uns das jetzt für unsere Abbildungen?

1. Die Farben sollten unterscheidbar, aber ähnlich sein!

1. Unterscheidbar, aber ähnlich

1. Unterscheidbar, aber ähnlich

Farbton, Sättigung und Helligkeit

Variiert immer Farbton, Sättigung und Helligkeit gleichzeitig.

Grau

2. Intuitives Verständnis: Diskrete Farben vs. Farbverläufe

  • Vor allem für diskrete Gruppen geeignet
  • Farbverläufe schwieriger (aber es gibt color scales dafür)
  • Bestimmte Farben (Grün = gut, Rot = Gefahr)

Größe

Farbe ist relativ

Beispiel: Grautöne vs Rottöne

Bild von Nature Methods.

Farbe ist relativ

Fragen: Warum ist das noch eine schelchte Color scale?

Siehe Colblindor.

Farbfehlsichtigkeit

protanopic right side

By Mark Fairchild, CC BY-SA 3.0, Link

  • Protanopie: Zapfentyp L (rot) fehlt: rot vs grün Schwäche

  • Deuteranopie: Zapfentyp M (grün) fehlt: rot vs grün Schwäche

  • Tritanopie: Zapfentyp S (blau) fehlt: blau vs grün, gelb vs violett Schwäche

  • Take the above scale and show that it is not great for color blindness

  • https://www.color-blindness.com/coblis-color-blindness-simulator/

library(colorblindcheck)
palette_check(theme_colors_red, plot = TRUE)  
          name n tolerance ncp ndcp min_dist mean_dist max_dist
1       normal 6   4.95969  15   15 4.959690  19.65649 41.78456
2 deuteranopia 6   4.95969  15   15 5.428903  19.54489 42.55279
3   protanopia 6   4.95969  15   14 3.976233  19.39475 41.15790
4   tritanopia 6   4.95969  15   15 5.557603  19.68098 40.93915

Das kann man sich natürlich auch zu Nutze machen (Passt aber vielleicht eher zu space? -> da nochmal zeigen, hier die Punkte enger zusammen )

Nicht zu viele!

Color for coding a third dimension

  • Wie viel macht sinn?
  • Scatterplot
  • Sättigung um dimensionalität der Farben darzustellen

Farbfehlsichtigkeiten

Farbsehtests

  • Farbwahrnehmung braucht Helligkeit und Fläche

Anwendung in ggplot2

Farben whlen

  • Name
  • rgb()
  • Nummer
  • Hex code

scale_color vs scale_fill

Farbskalen wählen

Manuell

ggplot(
  continent_co2_pct,
  aes(x = world_6region, 
      y = percentage, 
      fill = world_6region)) +
  geom_bar(stat = "identity", width = 1) +
  theme_minimal() +
  labs(title = "Share of global per capita CO2 consumption") +
  scale_fill_manual(values = c("red", "green", "blue", "yellow", "violet", "brown"))

my_color_scale <- c("East Asia & Pacific" ="red", 
                    "South Asia" = "green", 
                    "Sub-Saharan Africa" = "blue", 
                    "Europe & Central Asia" = "yellow", 
                    "Middle East & North Africa" = "violet", 
                    "Americas" = "brown")
ggplot(
  continent_co2_pct,
  aes(x = world_6region, 
      y = percentage, 
      color = world_6region)) +
  geom_bar(stat = "identity", width = 1) +
  theme_minimal() +
  labs(title = "Share of global per capita CO2 consumption") +
  scale_color_manual(values = my_color_scale)

Graustufen

ggplot(
  continent_co2_pct,
  aes(x = world_6region, 
      y = percentage, 
      fill = world_6region)) +
  geom_bar(stat = "identity", width = 1) +
  theme_minimal() +
  labs(title = "Share of global per capita CO2 consumption") +
  scale_fill_grey()

Externe Farb-Paletten

R Color Brewer

library(RColorBrewer)
display.brewer.all(colorblindFriendly=FALSE)

library(RColorBrewer)

ggplot(
  continent_co2_pct,
  aes(x = world_6region, 
      y = percentage, 
      fill = world_6region)) +
  geom_bar(stat = "identity", width = 1) +
  theme_minimal() +
  labs(title = "Share of global per capita CO2 consumption") +
  scale_fill_brewer(palette = "PuOr")

Externe Farb-Paletten

paletteer

Sammlung von Paletten aus diversen Paketen

library(paletteer)

ggplot(
  continent_co2_pct,
  aes(x = world_6region, 
      y = percentage, 
      fill = world_6region)) +
  geom_bar(stat = "identity", width = 1) +
  theme_minimal() +
  labs(title = "Share of global per capita CO2 consumption") +
  scale_fill_paletteer_d("LaCroixColoR::Orange")

Arten von Skalen

  • Intervallskaliert/Verhältnisskaliert: Es gibt Nullpunkt: Divergierende Skalen

    • Kein Nullpunkt: Gleichmäßige Abstände zwischen Farbwerten
  • Ordinal: Richtung und gute Unterscheidbarkeit im Farbraum

  • Nominalskaliert: Spriale/Diagnoale im Farbraum

  • Diskret

  • Continuous

  • Binned Vorgefertigte Paletten:

Sequenziell
Qualitativ
Diverging

Weiter Tools

  • Colorbrewer
  • Huemint

Farben: Zusammenfassung

Übung

  1. Teste, ob deine bisherige Abbildung für Menschen mit Farbfehlsichtigkeit lesbar ist.
  2. Baue eine eigene Color-Palette und wende sie auf deinen Plot an. Achte dabei auf Unterscheidbarkeit (Auch color blind), aber auch auf Design.

Gruppieren

Pulikum

Purpose

  • Exploratory vs. Explanatory
  • Kann oft über reines Zeigen der Daten hinausgehen.

Visual Form

Nützlichkeit

“Design is a requirement, not a cosmetic addition.” nature methods

Foto von Kelly Sikkema auf Unsplash

Foto von Yucel Moran auf Unsplash

Funktionelles Design

Welche Funktion?

Foto von BVG

Foto von BVG

Dabei kann es helfen, sich von bereits vorhandenen Plots inspirieren zu lassen.
Handschriftliche Skizze ist auch erstmal hilfreich!

Simplify to clarify

  • Redundanzen Reduzieren
  • Fokus auf das Wesentliche https://www.data-to-viz.com/caveat/declutter.html

Verteilungen Plotten

Aber: Simplify heißt nicht immer, Informationen zu reduzieren. Eher den Clutter! Versuchen, möglichst Verteilungen/ Spannweiten anstatt nur zusammengefasster Werte zu plotten. Evtl. IQB-Mittelwertsgrafik zeigen? Eine Grafik ist kann nur einen Teil der Zusammenhänge darstellen Im Schlechtesten Fall für Manipulation nutzbar.

Tuftes Data Ink ratio

  • So wenig Tinte wie möglich nutzen
  • Alles nicht essentielle entfernen
  • Redundanzen entferenen

Beispiel zeigen: Eins ist aufgeblasen, man braucht Zeit zur Orientierung. Ein anderes theme_tufte Beispiel zum Minimieren zeigen - Raincloud plots

Takeaways

Nochmal bei Tufte nachschauen - Kommunizieren von der größtmöglichen Anzahl von Ideen in kürzester Zeit. - Maximieren von Data-ink ratio - Minimieren von Chart-junk - Erhöhe Datendichte, Vervielfältige kleine Versionen der Abbildung für verschiedene Gruppen

Übung

Schlechte Grafiken verbessern: https://www.data-to-viz.com/caveats.html

Correll, M., Bertini, E., & Franconeri, S. (2020). Truncating the y-axis: Threat or menace? Proceedings of the 2020 CHI conference on human factors in computing systems, 1–12.
Huff, D. (1979). How to lie with statistics / by Darrell Huff.